Vers le prototypage rapide de programmes de fouille de données
نویسندگان
چکیده
Bien que guidées par des problèmes réels, les techniques mises au point dans le cadre de la recherche en fouille de données sont encore peu utilisées et leur mise en œuvre reste confinée à la discrétion de quelques programmeurs spécialistes. Ce ”transfert technologique” est donc freiné par un certain nombre de verrous, parmi lesquels le temps nécessaire à la mise au point des programmes opérationnels. Dans cet article, nous considérons une classe importante et large de problèmes de fouille de données : les problèmes d’extraction de motifs intéressants dans les données. Dans cette classe, nous nous intéressons au sous-ensemble particulier des problèmes représentables par des ensembles. A partir d’une caractérisation théorique d’un problème donné, nous proposons une librairie facilitant la résolution de tels problèmes, basée sur l’utilisation d’algorithmes et de structures de données génériques, et passant à l’échelle. Les caractéristiques et optimisations des algorithmes sont transparentes pour le programmeur, et seule l’implantation des propriétés spécifiques à son problème est laissée à sa charge. D’après les premiers résultats, les programmes opérationnels obtenus affichent des performances très intéressantes au regard de la rapidité et la simplicité de leur obtention. La librairie en cours de développement, implantée en C++, est accessible sur internet et libre de droits.
منابع مشابه
Vers l'intégration de la prédiction dans les cubes OLAP
L’analyse en ligne OLAP (On Line Analytical Processing) soutient les entrepôts de données dans le processus d’aide à la décision. Cependant, il n’existe pas d’outils pour guider l’utilisateur dans l’exploration, ni pour approfondir l’analyse vers l’explication et la prédiction. Dans un processus décisionnel, un utilisateur peut vouloir anticiper la réalisation d’évènements futurs. Le couplage d...
متن کاملVers une Ingénierie Ontologique à Base du Web Usage Mining
Résumé. Récemment, de nouvelles approches ont intégré l’utilisation de techniques de fouille de données dans le processus d’enrichissement d’ontologies. En effet, les deux domaines, fouille de données et méta-données ontologiques sont extrêmement liés : d’une part les techniques de fouille de donnée aident à la construction du Web sémantique, d’autre part le Web sémantique aide à l’extraction d...
متن کاملVers un méta-outil de capitalisation et d'organisation de simulations
RESUME. Le foisonnement des simulations numériques dans le processus de développement des produits pose des problèmes de traçabilité et de cohérence des simulations effectuées au long d’un projet. La réutilisation des modèles ou démarches de calcul est difficile au sein d’un même projet ou à travers les différents projets d’une entreprise. Il s’agit de construire au sein des entreprises des Sys...
متن کاملCauses of Increased Intracranial Blood Flow Rate (Angiographic Study)
"Etude etiologique de la circulation ra.pide iutra-rena-le" Le but de l'angiographle renale n'est pas '.seulement le controle anatomique de l'organe, une etude physiologique (Hemodynamique) doit toujours etre prise en consideration. Le temps normal de la circulation intra-renale selon les differents auteurs varie entre 6 a 8, 8 a 10 et 10 a 12 secondes, mais le temps moyen est de 6 a 8 seco...
متن کاملPortail Web de Veille Stratégique pour Mobile
Les techniques d’analyse multidimensionnelle sont actuellement bien maîtrisées pour toutes les données quantitatives disponibles sur les systèmes d’information des entreprises ou des administrations à condition que le SGBD s’y prête, que le schéma de la base soit adapté et que les données soient de qualité (homogènes, à jour, complètes, granularisées, compatibles,...). Il est toujours possible ...
متن کامل